GTC 2021 春 — AI Factory 概念与三芯片战略
开场:四股力量塑造着世界
GTC 2021 春是 NVIDIA 第一次系统性地把"AI 工厂"的雏形放到台面上讲。黄仁勋开场就抛出了他那年反复强调的四股力量:
"加速计算 是我们开创的技术方向,它让科学发现加速、为计算机产业指出一条向前的路。人工智能——尤其是它——取得了令人难以置信的进展:有了 NVIDIA GPU,计算机能学习,软件能写出人类写不出的软件。AI 软件以云服务的形式交付,以光速执行自动化。软件如今由微服务组成,在整个数据中心里扩展——数据中心本身成为一个计算单元。AI 和 5G 是开启第四次工业革命的原料——自动化和机器人学能够被部署到世界的边缘。而我们还需要一个奇迹——元宇宙,一个是我们世界的 数字孪生。"
他还画了一张 NVIDIA 这次演讲的四层架构:Omniverse(创建并仿真虚拟世界的平台)→ DGX 与数据中心(新 CPU、新 DPU、AI 药物发现、量子计算)→ EGX + Aerial 5G(把 AI 带到企业和边缘)→ Drive(汽车行业的革命)。这是他第一次用"stack"的比喻把 NVIDIA 的版图铺在一张图上。
一张能改变人一生的工具
开场他讲了一段他后来反复引用的故事:"一位科学家对我说过——因为你们的工作,我能在有生之年完成我一生的事业。我想不出比这更高的使命了。" 这句话奠定了整场演讲的情感基调。他接着说:"我们的目的是为这个时代的达·芬奇们打造工具——为了做到这件事,我们也在共同创造未来。"
然后是一组让人印象深刻的生态数字:累计出货超过 10 亿颗 CUDA 平台 GPU、云上 250 exaflops 的 GPU 算力、250 万名开发者、7500 家初创公司。他引用了 2012 年那个神话时刻:AlexNet 就是 Alex Krizhevsky、Ilya、Geoffrey Hinton 用 GeForce 训练出来的——"只要有一张 GeForce,每一个学生都能拥有一台超级计算机。"(GeForce、Ilya Sutskever、Geoffrey Hinton)
Omniverse:为虚拟世界打造的物理平台
"RTX 重置了计算机图形学。这让我们可以建 NVIDIA Omniverse——一个连接 3D 世界的共享虚拟世界平台。这并非没有科幻背景——Neal Stephenson 1990 年代初的小说《Snow Crash》里描述了一个叫 Metaverse 的世界,一种由共享 3D 空间和虚拟增强的物理空间组成的互联网的延伸。"
Omniverse 的几个核心组件都在这次被讲明白:
- Omniverse Nucleus:一个数据库引擎,连接用户、交换 3D 资产和场景描述。采用 Pixar 发明的开放标准 USD(Universal Scene Description)。多个用户可以同时连接 Nucleus,以 USD 片段的形式收发对虚拟世界的改动。
- 合成、渲染、动画引擎:完全物理级别的——全路径追踪,用 NVIDIA PhysX 做物理模拟,用 NVIDIA MDL 做材质,并且和 NVIDIA AI 深度集成。
- CloudXR:黄仁勋叫它"传送门"(Stargate)——你可以通过 VR 把自己"传送"进 Omniverse,AI 也可以通过 AR 从 Omniverse 里"传送"出来。
但真正的杀手级案例是 BMW。他和 BMW 董事会成员 Milan Nedeljkovic 博士做了一场虚拟厂房参观:
"BMW 是世界上最大的定制制造公司之一。他们在最先进的工厂里,每一分钟造一辆车,而每辆都是定制的——每年超过 250 万辆车,99% 是定制化的。我们和 BMW 一起造一座未来工厂,从头到尾完全在数字世界里设计、仿真、运营。工厂将变成一个机器人——编排内部的机器人、建造也是机器人的汽车。虚拟工厂和物理工厂会形成一个闭环——它们是数字孪生。"
BMW 计划用 Omniverse 仿真全球 31 座工厂,规划效率提升 30%。这是"工厂的数字孪生"第一次在 NVIDIA 的舞台上有这么具体的对象。
Omniverse 的哲学被浓缩成一句话:"Omniverse 是一个基于物理的虚拟世界,机器人可以在这里学会成为机器人。"(Isaac)这条技术路径后来一路延伸到 Isaac Gym、Cosmos、GR00T。
数据中心是新的计算单元
"数据中心是新的计算单元。" 这是这场演讲里最重要的一句概念声明之一。
他从数据中心的架构演化讲起:企业数据中心原来跑的是单体软件;虚拟化把它变成软件定义数据中心;云原生把它拆成可跨闲置资源调度的微服务;然后深度学习来了,CSP 靠 Mellanox 的高速低延迟网络对抗东西流量的爆炸。然后"零信任安全"又让基础设施软件处理本身成为数据中心里最大的工作负载之一。
"所以我们需要一种新的芯片,一种专为数据中心基础设施处理而设计的芯片——NVIDIA BlueField DPU。"
BlueField 的原理很直白:CPU 本来就只有那么多核心,每一核都在跑"软件定义数据中心"的栈时,真正能跑应用的核心就越来越少。"每年出货的大约 3000 万台数据中心服务器里,大约 1/3 被这些基础设施软件栈吃掉了——这个工作负载的增长比摩尔定律快得多。如果不卸载并加速它,数据中心能跑应用的 CPU 就会越来越少。BlueField 的时代来了。"
他同时发布了 BlueField-3(220 亿晶体管,第一款 400 Gbps 网络芯片,16 个 ARM 核,内置 VMware ESX 的完整虚拟化栈)并预告 BlueField-4(800 Gbps,加入 AI 计算)——"每 18 个月一代,3 年内 100 倍提升。"
DGX 系列:AI 的计算机
"在现代 AI 大爆发的起点,我们意识到要做出一种全新的计算机——因为一种全新的软件开发方式出现了。软件将由软件来写,运行在 AI 计算机上。" 这段话是他 AI 工厂叙事的最早成型。
"如果软件要由计算机来写,那么拥有最好软件工程师的公司,也必须拥有最好的计算机。" 他由此铺开了 DGX 系列:
- DGX A100:5 petaflops 计算单元,是所有更大系统的基础积木。
- DGX Station 320G:一台"装在盒子里的 AI 数据中心"——可以直接插在普通插座上、4 颗 A100、320 GB HBM2e、8 TB/s 内存带宽。"要用 40 台 CPU 服务器才能达到这个内存带宽。" 液冷到静音 37 分贝。售价 149000 美元——而一台同等性能的 CPU 集群要 100 万美元。
- DGX SuperPOD:一个完全集成、网络优化的 AI 数据中心,作为"产品"交付。起步 700 万美元,最大规模 6000 万美元。NVIDIA 自己的 Selene 就是四座 SuperPOD 组成的,是当时全球第五快的超级计算机、工业领域第一。
他也第一次讲了后来会无数次出现的一个算术:"模型规模每 2.5 个月就翻一倍。明年我们会看到万亿参数模型,2023 年会看到 100 万亿参数模型。作为非常粗略的对比——人脑有大约 125 万亿个突触。" 他借此发布了 Megatron——专门训练超大 Transformer 的框架。
Project Grace:NVIDIA 的第一颗数据中心 CPU
这是当天最重磅的硬件发布。Grace CPU 是 NVIDIA 第一颗面向数据中心的 CPU——以计算机先驱、美国海军少将 Grace Hopper 命名。
黄仁勋先解释为什么需要它。他拿 DGX 的一半做示例:每颗 GPU 连 80 GB 的 HBM,带宽 2 TB/s;四颗 GPU 加在一起是 320 GB、8 TB/s。对比 CPU 内存——1 TB 大,但只有 0.2 TB/s。"CPU 内存比 GPU 内存大 3 倍,但慢 40 倍。我们希望能把整个节点的 1320 GB 内存都用来训练 AI 模型。"
解决方案呢?"造更快的 CPU 内存、四通道直连 CPU,每个通道喂一颗 GPU。但问题来了——PCIe 变成新的瓶颈。我们当然可以用 NVLink——它够快——但没有一颗 x86 CPU 有 NVLink,更不用说四条。"
"所以今天,我们发布我们的第一颗数据中心 CPU——Project Grace。" 它基于 ARM 架构、为大数据加速计算场景(特别是 AI)而专门设计。每颗 CPU 可以做 300 SPECint;一台八 GPU DGX 搭载 Grace 后,总体 CPU 性能是 2400 SPECint——而今天最快的 DGX 只有 450 SPECint。"让我们对比一下——之前是 450,之后是 2400。这是系统级带宽和内存带宽的巨大提升。"
瑞士国家超算中心宣布会基于 Grace + 下一代 GPU 建一台叫 ALPS 的超算——20 exaflops 的 AI 算力,比当时最快的超算快 10 倍,2023 年上线。
这颗 CPU 的意义远超过它本身。黄仁勋宣布:"NVIDIA 的数据中心路线图现在由三颗芯片构成:CPU、GPU、DPU。每种架构两年一代,中间可能还有 tick。一年聚焦 x86 平台,一年聚焦 ARM 平台,每年都会有新品。三颗芯片,年年迭代,一套架构。"
这是 NVIDIA 首次正式宣布自己是一家"三芯片公司"。这条路线图后来一路延伸到 Grace Hopper(GH200)、Grace Blackwell(GB200)、Vera Rubin。
EGX + Aerial 5G:把 AI 带到边缘
"AI 有四波浪潮。第一波是重新发明计算,用新方式写软件——我们已经深耕近十年。第一波的采用者是互联网公司,他们有优秀的计算机科学家、大型计算基础设施、收集训练数据的能力。现在我们正处于下一波的起点——企业与工业边缘,AI 将革命性地改变制造、物流、农业、医疗、金融、交通这些世界上最大的产业。最后一波是自动系统——自动驾驶是一个绝佳例子,但未来所有会动的东西都会变成自动的。"
NVIDIA 的解法是 NVIDIA EGX + VMware。黄仁勋强调:"全球 70% 的企业都在用 VMware,NVIDIA 自己也是。" 过去 VMware 是把多个应用跑在一台虚拟机上;而 AI 恰恰相反——它要在多 GPU、多节点上跑 bare metal 的单一任务。"我们把 NVIDIA 所有的计算和数据传输优化都打通到 VMware 栈里,同时通过 BlueField 卸载加速——这样 VMware 的 30 万企业客户终于可以轻松构建 AI 基础设施。"
然后是 Aerial A100——一张把 Ampere GPU 和 BlueField DPU 合在一块的 PCIe 卡,同时是一座完整的 5G 基站。"把 5G 的全部能力带进云,也把云的全部能力带进 5G 边缘。"这是他在 GTC 2025 与 T-Mobile 合作、做 AI-RAN 的前身。
Jarvis、Merlin、Maxine、Morpheus:预训练模型即产品
NVIDIA 在 GTC 2021 春开始把 AI 模型变成"开箱即用"的产品——黄仁勋称之为 NVIDIA AI 平台:
- Jarvis:对话式 AI,开箱 90% 识别准确率,支持 5 种语言,端到端 100 毫秒级延迟。"听懂、理解、回应的速度比眨眼还快。"
- Merlin:开源推荐系统框架,ETL 快 10-50 倍、训练快 2-10 倍、推理快 3-100 倍。
- Maxine:视频会议 AI(眼神接触修正、面部编解码在 50 kbps 带宽下也能工作)——以后会成为你在 Omniverse 里的 avatar。
- Morpheus:数据中心安全平台,用 AI 做实时全包检查,让每一个服务器到服务器的通信都可以被监控。
- TAO:让你用自己的数据微调 NVIDIA 预训练模型,配合联邦学习。
- Triton Inference Server:跨所有主流框架、跨 GPU/CPU 的推理调度引擎。
- Fleet Command:云原生的边缘 AI 编排平台。
这些组件后来逐步演化、整合进 NIM 和 AI Foundry。可以说 GTC 2021 春是 NVIDIA 企业 AI 产品线的起点。
Drive 与 Atlan:把车变成可编程的计算机
这一段他强调了一个理念——"TOPS 是新的马力。开发者越懂 AV,算法就越先进,计算需求就越高。"
两个发布:
1. Drive Orin——2022 年量产,不仅是 AV 计算机,同时是汽车的中央计算机,在一颗芯片上处理仪表盘、信息娱乐、座舱交互 AI,以及最关键的"置信视图"(confidence view)——车当前对周围 3D 世界的感知。"未来,后视镜会被 3D 环视感知取代。"
2. Drive Atlan——下一代,单芯片 1000 TOPS,超过今天大多数 L5 robotaxi 的总算力。
他在这里甩出了一个未来判断:"未来的汽车会是完全可编程的计算机。汽车公司的商业模式会变成软件驱动的——为一辆车的整个生命周期提供软件服务。这种新的科技视角把汽车不再看作一件卖出去的产品,而是一个数千万、数亿台规模的装机基础——在上面可以造出数十亿美元的服务机会。"
"世界每年移动 10 万亿英里。哪怕只有一小部分由 robotaxi 完成,这个机会也是巨大的。美国到 2023 年会缺 10 万名卡车司机,欧盟已经缺 15 万人,中国缺 400 万司机。"
谢幕:20 年前是科幻,10 年前是梦想
"多么精彩的一届 GTC。我讲了几件事——NVIDIA 是一个全栈计算平台。我们在用 Omniverse 构建虚拟世界——这是一个会帮助我们构建下一波机器人和自动驾驶 AI 的奇迹平台。我们发布了新的 DGX 系统和新软件——训练超大 Transformer 的 Megatron、做药物发现的 Clara、做量子计算的 cuQuantum。NVIDIA 现在是一家三芯片公司——加上 Grace CPU,加上 BlueField-3 DPU。"
"我们宣布了 NVIDIA EGX + Aerial 5G,让所有公司和行业都能用上 AI。我们发布了 Drive——面向 10 万亿美元运输行业的端到端平台。从 Orin、Atlan、Hyperion 8 到 DriveSim……"
"20 年前,这一切都还是科幻小说;10 年前是梦想;今天,我们正活在其中。"
"感谢所有的开发者和合作伙伴,特别感谢 NVIDIA 的全体员工。我们的目的是把我们的手艺磨炼得更好,这样你们这个时代的达·芬奇们才能把你们的手艺磨炼得更好。归根结底,NVIDIA 是一件工具——一件让你能完成一生事业的工具。"
原文出处:Rev.com 完整转录稿